|
|
|
| Home | American Libraries | Canadian Libraries | Universal Library | Community Texts | Project Gutenberg | Biodiversity Heritage Library | Children's Library | Additional Collections |
| Anonymous User (login or join us) | Upload |
Books from the China-US Million Book Digital Library Project (CADAL)
Creating a universal free to read, open-source digital library containing over one million scanned books, with optical character recognition when possible to support full text searching, is the goal of the million book digital library project. Such a resource will lead to the democratization of knowledge by making available on the web, a unique library resource to scholars, students, and citizens around the world.
The objective of this project is to create a free-to-read, searchable collection of one million books, primarily in the English language, available to everyone over the Internet. This task is accomplished by scanning the books and indexing their full text. The text file is created, where possible, through optical character recognition. The result will be a unique resource accessible to anyone in the world 24x7x365, without regard to nationality or socioeconomic background.
Typical large high-school libraries house fewer than 30,000 volumes. One million volumes is the approximate size of the combined libraries at Carnegie Mellon University. One million books, therefore, is more than the holdings of any high-school, equivalent to the library at a substantial university and a significant fraction of all available books.
The availability of online search allows users to locate relevant information quickly and reliably thus enhancing student willingness and success in their research endeavors. This 24x7x365 resource would also provide an excellent testbed for language processing research in areas such as machine translation, summarization, intelligent indexing, and information mining.
·百万册书数字图书馆项目在中国的背景情况:
国家计委、教育部、财政部在2002年9月下发的《关于“十五”期间加强“211工程”项目建设的若干意见》的文件中,将“中英文图书数字化国际合作计划(CADAL)” 列入“十五”期间“211工程”公共服务体系建设的重要组成部分。CADAL与“中国高等教育文献保障系统(CALIS)”一起,共同构成中国高等教育数字图书馆的框架。
CADAL项目的建设目标是:在“十五”期间,建设为我国高校教学科研服务的百万册图书规模的数字资源,建成2个数字图书馆技术中心(浙江大学,中国科学院研究生院)和14个数字资源中心(北京大学,清华大学,浙江大学,复旦大学,南京大学,中国科学院研究生院,上海交通大学,西安交通大学,武汉大学,华中科技大学,吉林大学,中山大学,四川大学,北京师范大学),形成一套成熟的支持TB量级数字对象制作、管理与服务的技术平台,探索多媒体、虚拟现实等技术在数字图书馆中的应用,推动我国数字图书馆技术达到国际领先水平,为数字图书馆建设与服务的可持续发展奠定资源和技术基础。
本项目由浙江大学和中国科学院研究生院等单位共同承担。
本项目由国家投资建设,同时得到“中美百万册书数字图书馆合作计划”(China-US Million Book Digital Library Project)美国合作方投入的相当于1千万美元的软硬件系统支持,因而项目的英文名称确定为China-America Digital Academic Library,简称CADAL。
本项目通过国际合作的方式进行数字图书馆建设与研究,是首次利用引进外资方式进行“211工程”建设。项目的实施对于改善我国高校教学科研的信息环境、建设一流大学具有重要意义。本项目将推动海量数据存储、管理、检索和多媒体处理等方面的研究工作,促使我国在大规模数字图书馆建设和信息服务领域向世界先进水平迈进。项目建设还将为带动数字图书馆领域新的国际合作计划提供基础。因此,本项目具有重大的实用意义、研究价值和发展前景。
本项目的特点是:
·数字化100万册中英文图书。其中,将从美国数字图书馆联盟高校选择50万册英文图书资源进行数字化转换,此举将有效扭转国内高校和科研机构英文原版图书资源严重不足的状况;50万册中文图书资源将突出高校教学科研的需要,兼顾保存和传承我国优秀传统文化的要求。
·采用开放式电子书标准,采用600dpi分辨率进行扫描,有别于目前国内电子书大都需要专用阅读器和低显示精度的状况,将大大方便读者的阅读,有利于数字资源的长期保存与进一步开发利用。
·建成2个数字图书馆技术中心和14个数字资源中心,在CERNET上形成强大的分布式数字图书馆系统。海量数字资源的形成与开放服务,将有效发挥国家对CERNET和CALIS系统建设的投资效益。
·中美合资、合作研究开发数字图书馆技术,确立完善的技术标准和规范,特别是形成一套成熟的支持TB量级数字对象制作、管理与服务的技术平台,探索多媒体、虚拟现实等技术在数字图书馆中的应用,推动我国数字图书馆技术达到国际领先水平。